01 知识表达与推理

对记忆的理解:
Pasted image 20250604185411.png|500


01 命题逻辑

命题

命题:一个能确定为真或为假的陈述句

分类

命题连接符号 表示形式 意义
与 (and) pq 命题合取 (conjunction),即“pq
或 (or) pq 命题析取 (disjunction),即“pq
非(not) ¬p 命题否定 (negation),即“非 p
条件 (conditional) pq 命题蕴含 (implication),即“如果 pq
双向条件 (bi-conditional) pq 命题双向蕴含 (bi-implication),即“p 当且仅当 q

逻辑等价:给定命题 p 和命题 q, 如果 pq 在所有情况下都具有同样真假结果,那么 pq 在逻辑上等价,一般用 来表示,即 pq

逻辑等价的例子
αββα (Λ的交互律) (αβ)¬αβ (蕴涵消除)
αββα (∨的交互律) (αβ)(αβ)(βα) (双向消除)
(αβ)γα(βγ) (Λ的结合律) ¬(αβ)(¬α¬β) (德摩根定律)
(αβ)γα(βγ) (∨的结合律) ¬(αβ)(¬α¬β) (德摩根定律)
¬(¬α)α (双重否定) (α(βγ))(αβ)(αγ) (Λ对∨的分配律)
(αβ)¬β¬α (逆否命题) (α(βγ))(αβ)(αγ) (∨对Λ的分配律)

推理规则

推理是按照某种策略从前提出发推出结论的过程

推理规则的例子
假言推理
(Modus Ponens)
αβ, αβ
与消解
(And-Elimination)
α1α2αnαi(1in)
与导入
(And-Introduction)
α1,α2,...,αnα1α2αn
双重否定 (Double-Negation Elimination) ¬¬αα
单项消解或单项归结 (Unit Resolution) αβ,¬βα
消解或归结 (Resolution) αβ,¬βγαγ α1α2αm,¬αkα1α2αk1αk+1αm

范式 (normal form):把命题公式化归为一种标准的形式

任一命题公式都存在着与之等值的析取范式与合取范式,但命题公式的析取范式与合取范式都不是唯一的


02 谓词逻辑

命题逻辑的局限性:在命题逻辑中,每个陈述句是最基本的单位 (即原子命题),无法对原子命题进行分解

谓词逻辑:将原子命题进一步细化,分解出个体、谓词 predicate 和量词 quantifier

个体与谓词

例如,𝑃(𝑥) 表示:𝑥<𝑥2

函数与谓词的区别

  • 函数是从定义域到值域的映射
  • 谓词是从定义域到{True, False}的映射

事实符号化

  1. Richard 是国王。
  • King (Richard)
  • 其中,Richard 是一个个体常量,King 是一个描述“国王”这个一元关系的谓词
  1. Lucy 和 Lily 是姐妹
  • Sister (Lucy, Lily)
  • 其中,Lucy 和 Lily 是两个个体常量,Sitter 是一个描述“姐妹” 这个二元关系的谓词

量词

量词

量词之间的逻辑等价关系

xP(x)¬x¬P(x)x¬P(x)¬xP(x)¬xP(x)x¬P(x)xP(x)¬x¬P(x)

变元

相关的逻辑等价关系:

(x)(A(x)B)(x)A(x)B(x)(A(x)B)(x)A(x)B(x)(A(x)B)(x)A(x)B(x)(A(x)B)(x)A(x)B (x)(A(x)B(x))(x)A(x)(x)B(x)(不成立)(x)(A(x)B(x))(x)A(x)(x)B(x)(x)(A(x)B(x))(x)A(x)(x)B(x)(x)(A(x)B(x))(x)A(x)(x)B(x)(不成立) (x)(y)A(x,y)(y)(x)A(x,y)(x)(y)A(x,y)(y)(x)A(x,y)(x)(y)A(x,y)(y)(x)A(x,y)(x)(y)A(x,y)(x)(y)A(x,y)(y)(x)A(x,y)(x)(y)A(x,y)(x)(y)A(x,y)(y)(x)A(x,y)(x)(y)A(x,y)(y)(x)A(x,y)(y)(x)A(x,y)(x)(y)A(x,y)

A(x)是谓词公式,xy是变元,a是常量符号,则存在如下谓词逻辑中的推理规则:

项、原子公式与合式公式

项、原子谓词公式、合式公式

专家系统

Pasted image 20250604201549.png|450


03 知识图谱推理

基本概念

知识图谱

Pasted image 20250604202428.png|315

现在面临一个问题,如何从知识图谱中推理得到:father (David, Ann) ?

(x)(y)(z)(Mother(z,y)Couple(x,z)Father(x,y))

归纳逻辑程序设计 (inductive logic programming,ILP) 算法

ILP:使用一阶谓词逻辑进行知识表示,通过修改和扩充逻辑表达式对现有知识归纳,完成推理任务

对于:

(x)(y)(z)(Mother(z,y)Couple(x,z)Father(x,y))

FOIL 算法

哪些谓词好呢? 可以作为目标谓词的前提约束谓词?

FOILGain=m+^(log2m+^m+^+m^log2m+m++m)

路径排序算法(path ranking algorithm, PRA)

路径排序推理算法(PRA)的基本思想:将实体之间的关联路径作为特征,来学习目标关系的分类器,可以分为如下三步:

基于分布式表示的知识推理

将知识图谱中的节点和节点之间的关系均映射到连续数值空间中 (即分布式表示), 同时对映射过程进行约束,使得知识图谱中节点之间的拓扑结构得以保留

Pasted image 20250604220200.png|450

马尔可夫逻辑网络

  • 马尔可夫网络与一阶逻辑相结合的一种统计关系学习模型
  • 可在一阶谓词逻辑中添加不确定性
  • 其核心思想是通过为规则绑定权重的方式将一阶谓词逻辑规则中的硬性约束 ( hard constraints) 进行软化
    • 一阶谓词逻辑知识库可看作是在一个可能世界的集合上建立一系列硬性规则,即如果一个世界违反了其中的某一条规则,那么这个世界的存在概率即为零
    • 马尔可夫逻辑网的基本思想是让那些硬性规则有所松弛,即当一个世界违反了其中的一条规则,那么这个世界存在的可能性将降低,但并非不可能。一个世界违反的规则越少,那么这个世界存在的可能性就越大


04 概率图谱推理

概率图(probabilistic graph)

概率图模型一般分为贝叶斯网络(Bayesian Network)和马尔可夫网络(Markov Network)两大类

贝叶斯网络

贝叶斯网络满足局部马尔可夫性(local Markov property):在给定一个节点的父节点的情况下,该父亲节点有条件地独立于它的非后代节点(non-descendant)

马尔可夫逻辑网络

给定一个由若干规则构成的集合,集合中每条推理规则赋予一定权重,则可如下计算某个断言 x 成立的概率:

P(X=x)=1Zexp(iwini(x))=1Ziϕi(x{i})ni(x)

其中ni(x)是在推导x中所涉及第i条规则的逻辑取值 (为 1 或 0)、wi是该规则对应的权重,z是一个固定的常量,可由下式计算:

Z=xXexp(iwini(x))

05 因果推理

辛普森悖论

如下是某组病人在是否尝试新药以后的恢复情况:不用药病人的恢复率高于用药病人的恢复率
对所有病人按照性别分组后,当比较按性别分组的两类病人的恢复率时,却发现用药病人的恢复率均高于不用药病人的恢复率
Pasted image 20250614180230.png|400

在某些情况下,忽略潜在的“第三个变量”(本例中性别就是用药与否和恢复率之外的第三个变量),可能会改变已有的结论

事实上,辛普森悖论的主要原因是因为“第三变量”导致了用药与否和恢复率之间的虚假关联

关联关系的三种来源

Pasted image 20250614180508.png|375

因果关联:数据中两个变量,如一个变量是另一个变量的原因,则该两变量之间存在因果关联

混淆关联:数据中待研究的两个变量之间存在共同的原因变量

选择关联:数据中待研究的两个变量之间存在共同的结果变量

两种理论框架

潜在因果框架

结构因果模型

对于有向无环图模型,模型中 d 个变量的联合概率分布:

P(x1,x2,,xd)=j=1dP(xj|xpa(j)) P(X=x,Y=y,Z=z)=P(X=x)P(Y=y|X=x)P(Z=z|Y=y)

更复杂的,对于下图,有:

P(X1,X2,X3,X4,X5,X6,Xi,Xj)=P(X2)×P(X3)×P(X1|X2,X3,Xi)×P(X4|X2)×P(X5|X3)×P(X6|Xi)×P(Xi|X4)×P(Xj|X1,X5,X6)

Pasted image 20250614182632.png|300

因果干预与 do 算子

干预:改变明确存在关联关系的某变量取值,研究变量取值改变对结果变量的影响

"do"算子:计算当系统中一个变量取值发生变化、其他变量保持不变时,系统输出结果是否变化

因果效应

因果效应:给定因果图 G,PA 表示 X 的父节点集合,则 XY 的因果效应为:

P(Y=y|do(X=x))=zP(Y=y|X=x,PA=z)P(PA=z)

其中,z 是 PA 的具体取值

我们解释如上公式

以前面所言辛普森悖论为例,其因果图可以用下图表示:

可以对病人的用药情况进行干预,来计算因果效应差

P(Y=1|do(X=1))P(Y=1|do(X=0))

对用药情况 X 进行干预并固定其值为 x 时,可将所有指向 X 的边均移除:
Pasted image 20250614184746.png|250

因果效应 P(Y=y|do(X=x)) 等价于上图,引入干预的操纵图中的条件概率 Pm(Y=y|X=x),继续推导:

P(Y=y|do(X=x))=Pm(Y=y|X=x)=zPm(Y=y|X=x,Z=z)Pm(Z=z|X=x)=zPm(Y=y|X=x,Z=z)Pm(Z=z)

最后得到正常 (无干预) 条件下的概率表示的因果效应:

P(Y=y|do(X=x))=zP(Y=y|X=x,Z=z)P(Z=z)

因果模型的层次化示意图

层次化示意图
可观测问题 What if we see A (what is?) $P(y\ A)$
决策行动问题 What if we do A (what if?) $P(y\ do (A))$ (如果采取 A 行为,则 y 将如何)
反事实问题 What if we did things differently (why) $P(y'\ A)$ (如果 A 为真,则 y′将如何)

Copyright © 2025 Casette.
Made with Obsidian DG.